llm幻觉

苹果发布RL4HS框架：精准定位LLM幻觉，性能超越GPT-5与o3

苹果公司在大语言模型（LLM）可靠性研究领域取得重大突破，其发布的RL4HS强化学习框架，实现了对模型幻觉内容的“精准定位”——不仅能判断输出是否存在错误，更能直接标出具体的错误段落。在权威基准测试中，该框架性能超越GPT-5、o3等当前顶尖商用模型，为解决L

其核心突破在于：模型不再只是笼统地提示有错误，而是能直接指出具体哪一段文字是错误的。这对于需要修改输出或进行事实审查的用户来说，大大节省了时间。